AI资讯新闻榜单内容搜索-Claude 3.5

Anthropic首次切开Claude大脑，「AI黑箱」彻底破解？心算诡异思考过程曝光

AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」，甚至故意撒谎。Anthropic刚刚推出了一项突破性研究，用类似大脑扫描的技术，深入Claude 3.5 Haiku的「脑子」，揭开了它运行的一些秘密。

来自主题: AI资讯

10915 点击 2025-03-28 17:45

Nature：科研人员最爱AI工具大盘点！从推理到编程，哪款才是最佳助手？

本文介绍了当前最受科研人员青睐的AI模型，推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2，它们各有优劣，为科研人员提供了多样选择。

来自主题: AI资讯

12022 点击 2025-03-25 11:53

Manus让电脑使用再度翻红，一文带你全面认知Computer Use Agent，附项目论文资源

Manus的火爆带热了多个技术概念，Computer Use Agent就是其中之一。但要探讨这种“电脑使用”智能体，还得从Claude 3.5 Sonnet说起。

来自主题: AI资讯

10601 点击 2025-03-18 17:01

DeepSeek-R1自写CUDA内核跑分屠榜！斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿研究者发现，DeepSeek-R1生成的自定义CUDA内核，完爆了o1和Claude 3.5 Sonnet，拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线，但GPU编程加速自动化的按钮，已经被按下！

来自主题: AI技术研报

12235 点击 2025-02-27 16:17

OpenAI掀「百万美金」编程大战！Claude 3.5 Sonnet狂赚40万拿下第一

OpenAI刚刚发布SWE-Lancer编码基准测试，直接让AI模型挑战真实外包任务！这些任务总价值高达100万美元。有趣的是，测试结果显示，Anthropic的Claude 3.5 Sonnet在「赚钱」能力上竟然超越了OpenAI自家的GPT-4o和o1模型。

来自主题: AI技术研报

9888 点击 2025-02-19 15:19

编程不再是专业技能！Replit「Agent」引爆编程革命，零基础也能轻松上手

Replit凭借创新的AI编程平台「Agent」，在短短半年内实现了5倍的收入增长。通过采用Claude 3.5 Sonnet模型和多智能体架构，Replit为编程行业带来了前所未有的革新，推动了一个人人皆可参与的编程时代。

来自主题: AI资讯

8644 点击 2025-02-14 18:45

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速缩小差距

刚刚，大模型竞技场榜单上再添一款国产模型——来自阿里，Qwen2.5-Max，超越了DeepSeek-V3，以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯

9333 点击 2025-02-05 11:19

通用Coding Agent不可能好用，Code Review能力最难被AI替代？35岁程序员的春天来了 | 万有引力

AI 编程工具的发展令人目不暇接。从年初 Devin 这款被称为“首个真正的 AI工程师”的产品发布，到年中 Anthropic 在 Claude 3.5 Sonnet 模型推出「Artifacts」功能的重大突破，再到 Cursor、Windsurf 等新一代 IDE 的崛起，AI 正在重塑程序员的工作方式。

来自主题: AI资讯

4681 点击 2025-01-20 20:20

最强代码模型刷新：Mistral新品上线即登顶，上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral，又上新了！而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐，共同位列 Copilot 竞技场第一名。

来自主题: AI资讯

9504 点击 2025-01-14 15:42

纯视觉方案，精准操控电脑和手机！港大Aria-UI登顶，超越Claude 3.5

Aria-UI通过纯视觉理解，实现了GUI指令的精准定位，无需依赖后台数据，简化了部署流程；在AndroidWorld和OSWorld等权威基准测试中表现出色，分别获得第一名和第三名，展示了强大的跨平台自动化能力。

来自主题: AI技术研报

10895 点击 2025-01-09 10:54